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各 苹果 放置 在 B 前 的 成 本 大 于 B 自身 获取 苹果 的 成 本 ， 即 不 符合 成 本 最 小 化 条 件 ， 条 件 间 
制 的 差异 消失 (实验 二 )， 且 对 不 同 动作 模式 中 变化 的 辨别 相当 (实验 三 b)。 鉴 于 已 有 研究 
所 诱发 的 u 抑制 强 于 客体 导向 性 意图 ， 且 人 们 对 存在 社会 性 意图 的 两 个 智 
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人 类 通过 丰富 的 动作 或 行为 与 外 界 物理 客体 和 社会 个 体 建立 联系 ， 以 满足 不 同 需求 
(Miller, 2001)。 在 观察 这 些 复杂 的 行为 时 ， 人 类 的 视觉 系统 在 感知 物理 层面 运动 信息 的 同时 ， 
还 可 对 其 意图 进行 推理 和 识别 , 进而 表征 成 具有 目的 指向 性 的 动作 模式 (Blakemore & Decety, 
2001)。 动 作 意 图 识别 存在 高 度 的 不 确定 性 (UlIman etal., 2009)， 例 如 : 当 手 趋 近 茶杯 时 ， 既 
可 将 茶杯 当 作 手 的 动作 的 目标 ( 即 伸手 取 到 茶杯 喝 水 )， 也 可 将 茶杯 理解 为 手 的 运动 应 越过 的 
障碍 ( 即 伸手 越过 茶杯 抓 取 另 一 物件 )。 那 么 ， 人 类 视觉 系统 基于 动作 与 对 象 间 的 哪些 信息 ， 
才能 够 实现 对 动作 意图 的 有 效 识别 ? 
以 往 研 究 者 针对 动作 指向 物理 客体 以 满足 其 需求 的 非 社会 性 意图 ( 即 客体 导向 性 意图 ， 
= object-directed intention， 其 不 涉及 他 人 ) 的 识别 ,开展 了 大 量 研究 (Heineman-Pieper 2009)， 提 
出 视觉 系统 将 行为 场景 分 为 动作 、 目 标 ( 或 结果 ) 状 态 和 情境 因素 三 个 基本 要 素 ; 个 体 对 这 三 
个 要 素 间 关系 的 解释 , 遵循 动作 在 情境 因素 的 约束 下 以 最 小 成 本 实现 目标 状态 这 一 最 根本 的 
理性 原则 (Csibra et al., 2003; Gergely & Csibra, 2003). Jara-Ettinger 等 采用 效用 函数 (Utility = 
Reward - Cost) 来 描述 动作 与 目标 的 关系 , 其 认为 由 于 行为 主体 有 具备 理性 这 一 根本 特性 , 故 动 
作 遵 循 效 用 最 大 化 的 方式 实现 目标 。 因此 ， 当 其 它 条 件 不 变 时 , 若 行 为 和 当前 所 趋 近 的 对 象 
具有 最 大 效用 值 时 ， 则 两 者 间 具 有 目标 指向 关系 (Jara-Ettinger et al., 2015)。 然 而 ， 动 作 意 图 
不 仅 包括 以 指向 物理 客体 为 目标 的 客体 导向 性 意图 , 还 包含 以 指向 社会 主体 为 目标 ,， 且 影响 
对 方 行为 的 社会 交互 意图 (Canessa et al., 2012; Hobbs & Spelke, 2015)， 也 即 社会 性 意图 (social 
intention)。 针 对 社会 性 意图 的 识别 (主要 是 指 两 人 的 交互 ， 下 同 )， 有 研究 者 提出 双方 行为 的 
© 耦合 性 (contingency) 是 关键 决定 因素 之 一 ， 认 为 只 要 某 一 个 体 动作 导致 另 一 个 体 动作 改变 目 
有 具有 即时 同步 性 ， 二 者 间 就 可 能 被 视 为 存在 以 交互 为 目的 的 指向 关系 ( 详 见 De Jaegher et al., 
2010 的 综述 )， 如 : 握手 。 然 而 ， 后 续 研 究 表明 ， 当 两 个 个 体 共同 追逐 的 某 个 目标 被 设置 为 
不 可 见 时 ， 即 使 个 体 间 行 为 存在 耦合 性 ， 人 们 也 难以 识别 二 者 间 的 意图 ， 只 有 当 妃 逐 的 目标 
可 见 时 ， 其 行为 才 被 识别 为 具有 社会 性 意图 (Yin etal.,2013)。 这 类 研究 提示 ， 除 了 行为 的 耦 
合 性 ， 人 们 也 可 能 基于 其 它 线索 或 信息 对 社会 性 意图 进行 识别 (Auvray et al., 2009). FA, 
本 研究 将 进一步 考察 这 一 识别 过 程 中 可 被 利用 的 其 他 线索 或 信息 。 
社会 性 意图 虽 与 客体 导向 性 意图 所 指向 的 对 象 各 异 , 但 其 执行 行为 的 主体 均 是 存在 理性 
的 智能 个 体 ， 故 也 可 基于 动作 效用 最 大 化 这 一 理性 原则 来 分 析 交 互 意图 的 识别 问题 (Gergely 
& Jacob, 2012). 社会 交互 行为 指向 的 对 象 是 另 一 理性 的 社会 个 体 , 只 分 析 某 个 个 体 的 动作 效 
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用 也 许 不 适用 于 这 类 存在 多 个 行为 主体 的 情境 。 研 究 表明 人 们 以 整体 的 方式 对 交互 行为 进行 
表征 , 该 表征 方式 暗示 视觉 系统 可 能 在 整体 水 平 上 对 交互 行为 的 效用 最 大 化 进行 计算 , 也 即 
对 交互 多 方 行为 的 收益 和 成 本 进行 综合 考虑 (T6r6k et al., 2019)。 据 此 ， 当 满足 如 下 条 件 时 : 
智能 体 A 协助 智能 体 B 达成 目标 状态 所 需要 的 成 本 小 于 智能 体 B 单独 达成 该 目标 状态 所 需 
要 的 成 本 时 (简称 为 成 本 最 小 化 ， 如 递送 他 人 较 难 拿 到 的 物品 )， 其 达到 整体 层面 的 效用 最 大 
化 ， 可 推测 该 动作 模式 被 识别 为 具有 社会 性 意图 。 也 即 ， 视觉 系统 在 识别 社会 性 意图 时 ， 可 
利用 的 线索 包括 成 本 最 小 化 信息 。 但 该 假设 并 不 排除 社会 性 意图 识别 中 存在 其 他 线索 的 可 能 
性 ， 如 上 文 提 到 的 耦合 性 ， 仅 假定 成 本 最 小 化 信息 是 社会 性 意图 识别 的 充分 而 非 必 要 条 件 。 

本 文中 将 采用 脑 电 指标 u 节律 (8~13 Hz) 对 是 否 识别 到 社会 性 意图 进行 间接 测量 (如 图 
所 示 )。 节律 位 于 感觉 运动 皮层 (C3 和 C4 电极 )， 被 认为 产生 于 负责 动作 意图 加 工 的 重要 功 
能 区 一 一 镜像 神经 系统 (Mirror Neuron System)， 其 中 镜像 神经 系统 活动 越 强 ，h 抑制 越 大 
(Muthukumaraswamy et al., 2004; Oberman et al., 2005)。 研 究 发 现 ， 由 于 社会 性 意图 加 工 需 同 
时 考虑 两 个 主体 的 行为 , 该 加 工 相 比 只 包含 单个 个 体 的 非 社会 性 意图 的 加 工 , 对 镜像 神经 系 
统 的 需求 更 高 ,因此 激活 也 更 强 (Centelles etal., 2011), 而 镜像 神经 系统 的 活动 可 体现 在 节 
律 的 抑制 上 ， 因 此 u 抑制 的 强度 可 用 来 指示 被 试 是 否 将 观察 到 的 行为 识别 为 社会 性 意图 
(Oberman et al., 2007; Yin et al., 2020)。 其 中 ， 相 比 非 社会 性 的 客体 导向 意图 行为 ， 若 某 行为 
产生 更 强 的 上 抑制, 则 可 说 明 其 被 识别 为 具有 更 强 的 社会 性 意图 , 且 该 指标 已 成 功 应 用 于 社 


会 性 意图 识别 的 相关 研究 (Oberman et al., 2007; Yin et al., 2020)。 
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在 B 面前 的 动作 成 本 ， 小 于 B 通过 自身 的 动作 获得 该 目标 物 的 成 本 ， 但 当 B 前 
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因此 ,将 上 述 两 种 实验 分 别 与 探 于 
同样 的 运动 方式 但 将 苹果 放置 在 被 栅栏 围 住 的 石头 面前 ， 
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， 本 研究 还 采用 了 行为 指标 (如 


色 实 线 为 A 的 


运动 路 径 ， 绿 色 虚 线 为 B 的 


图 1 所 示 ， 检 测 被 试 对 


不 同 变化 的 敏感 性 ， 即 辨别 力 ) 考 察 被 试 所 识别 的 意图 是 否 为 社会 性 意图 。 实 验 采 用 变化 觉 
察 范式 ， 要 求 被 试 记忆 一 系列 相同 动作 模式 的 动画 (记忆 项 )， 之 后 要 求 被 试 判断 检测 阶段 的 


动画 (检测 项 ) 是 否 在 记忆 项 中 出 现 过 (如 图 7 所 示 )。 其 中 ， 检 测 项 的 变化 包括 角色 交换 ( 即 A 
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Te 


各 苹果 放置 在 智能 体 B 前 变 成 B 将 苹果 放置 在 智能 体 A 前 )、 结 构 改变 ( 即 A 将 苹果 放置 在 


能 体 B 前 和 C 将 苹果 放置 在 智能 体 D 前 ， 变 为 C 将 苹果 放置 在 智能 体 B 前 )。 已 有 研究 


证 实 , 与 格式 塔 组 织 相 似 ,两 个 存在 社会 交互 意图 的 个 体 在 工作 记忆 中 会 被 组 织 在 一 起 ,并 


作为 整体 单元 分 组 进行 存储 (Stahl & Feigenson, 2014; Vestner et al., 2019; Ding et al., 2017). 


鉴于 记忆 分 组 可 提升 被 试 对 跨 整 体 结构 间 的 区 分 度 ， 但 使 得 结构 内 的 元 素 容 易 混 淆 (Papeo， 
2020; Sedikides et al., 1993; Sherman et al., 2002; Suzuki & Cavanagh, 1995)， 可 推测 当 智 能 体 
A 与 B 有 交互 意图 时 ， 相 比 无 交互 意图 时 ， 由 于 A 与 B 被 整合 成 一 个 具有 交互 关系 的 记忆 
分 组 ， 人 们 更 容易 辨别 其 结构 改变 ， 而 对 角色 交换 不 敏感 ， 呈 现 记忆 混 清 效应 (实验 三 a); 


反之 ， 则 辨别 力 相当 (实验 三 b)。 


2 实验 一 
本 实验 以 顶 叶 的 pe 节律 作为 指标 ， 呈现 智能 体 A 将 苹果 放置 在 被 栅栏 围 住 的 智能 体 B 
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21 名 在 校 大 学 生 
度 加 大 ， 导 致 脑 电 数据 质量 较 差 ， 故 予以 剔除 。 最 终 获 得 20 名 (其 中 男性 8 名 ， 女 性 12 名 ) 


常 ， 无 色盲 


自愿 参与 本 实验 ， 其 中 1 名 被 试 因数 据 收集 过 程 中 电极 脱落 或 运动 幅 


Hu 


有 效 被 试 的 实验 数据 ， 被 试 的 年 龄 在 17~24 岁 之 间 (M = 19.5, SE = 0.4)， 视 力 或 矫正 视力 正 
， 艾 无 身心 疾病 。 实 验 结束 后 ， 被 试 获得 50 元 人 民 币 作为 报酬 。 


= 


该 样本 量 参考 


了 以 往 用 上 指标 来 探讨 动作 加 工 ， 尤 其 是 对 交互 行为 加 工 的 相关 研究 ， 其 样本 量 在 20 名 被 
试 左右 ， 结 果 的 效应 量 处 于 中 等 水 平 (f 介 于 0.25~0.46 之 间 ; Kourtis et al., 2019; Yin et al., 


2017)。 为 保持 实验 样本 量 的 一 臻 性， 后续 实 验 中 也 招募 了 20 名 有 效 被 试 。 该 实验 获得 了 宁 


波 大 学 心理 学 而 


知情 同意 书 。 


2.2 实验 仪器 与 刺激 


实验 采用 19 英寸 CRT 示 器 ,分 辩 率 为 800x600, 刷新 率 为 100Hz, 被 试 距 屏 幕 约 60cm。 


究 伦 理 委 员 会 同意 , 且 在 实验 前 保证 每 个 被 试 充分 知晓 实验 要 求 , 并 签署 了 


所 有 刺激 材料 的 呈现 和 实验 流程 通过 MATLAB 的 工具 箱 Psychophysics Toolbox (Brainard, 


1997) 来 控制 。 


< 
=, 


实验 束 


| 激 材 料 为 


电脑 动画 ， 其 通过 3D 动画 建 模 软 件 blender 2.78a 制作 而 成 ， 显 示 大 


小 为 11.1°x8.3*。 所 有 动画 均 设 置 为 从 12.2° 的 观看 距离 和 73° 的 3D 透视 图 的 视角 呈现 。 动 


画 时 长 23， 其 场景 中 包括 两 个 不 同 的 动画 角色 (一 个 运动 的 智能 体 ， 以 下 称 为 “智能 体 


A”， 与 一 个 静止 的 智能 体 ， 以 下 称 为 “智能 体 B”)， 一 个 石头 以 及 一 个 蔷 果 。 其 中 ， 每 


个 动画 中 智能 体 的 外 形 相 异 ， 且 每 个 试 次 从 36 对 不 同 的 组 合 中 随机 选择 (9 种 不 同 外 形 的 


智能 体 ， 两 两 组 合 而 得 )。 动 画 中 的 石头 和 智能 体 B 分 布 在 场景 的 两 侧 ， 其 距离 中 心 2.8°， 


且 均 被 难以 逾越 的 栅栏 围 着 ， 但 在 栅栏 中 间 有 个 小 洞口 (智能 体 无 法 穿 过 )， 以 用 于 智能 体 


A 放置 苹果 。 动 画 开始 前 苹果 位 于 石头 和 智能 体 B 的 正中 间 ， 智 能 体 A 位 于 屏幕 中 心 上 方 


1.6" 处 。 整 个 动画 中 只 有 智能 体 A 运动 ，A 首先 垂直 向 下 运动 至 苹果 所 在 位 置 (0.5 秒 )， 之 


后 向 左 或 向 右 转向 智能 体 B 或 石头 (0.1 秒 )， 接 着 向 智能 体 B 或 石头 运动 ， 并 将 苹果 放置 在 


oO 


ral 


B 前 方 (0.5 秒 )， 最 后 返回 其 初始 位 置 (0.9 秒 )。 根 据 苹果 被 放置 目的 地 是 智能 体 ( 图 3a) 还 


jm 


石头 (图 3b)， 分 为 两 种 实验 条 件 。 这 两 种 条 件 除 了 智能 体 A 放置 苹果 的 目的 地 不 同 外 ， 具 


有 相同 的 运动 学 特性 。 但 当 智 能 体 A 将 苹果 放置 在 智能 体 B 前 面 时 ， 由 于 其 动作 成 本 小 于 


NS 


B 通过 自身 的 动作 获得 该 目标 物 的 成 本 ( 需 绕 过 几乎 无 法 逾越 的 栅栏 )， 故 符合 成 本 最 小 化 


条 件 ， 应 被 识别 为 具有 社会 性 意图 。 实 验 动画 示例 可 见 


https://osf.10/jfvxu/?view_only=c76000bc9a4b4f009 15 1638441e79c99. 


除了 上 述 两 种 动画 ， 实 验 中 还 构建 了 其 它 动 画 ， 作 为 填充 动画 ， 要 求 被 试 计数 其 数量 ， 


以 使 得 被 试 的 注意 集中 在 屏幕 的 动画 上 ,该 类 动画 与 上 述 动画 基本 相同 , 除了 在 0.3s~1.7s 之 


间 智 能 体 A 会 随机 且 连 续 消 失 0.8s。 


G 


Lae ttf == =. ‘ 


图 3 实验 一 中 存在 栅栏 时 放置 苹果 至 智能 体 (a) 和 石头 (b) 与 实验 二 中 不 存在 栅栏 时 放置 苹果 至 智能 体 (和 石头 (d) 的 动作 示 
意图 


2.3 实验 流程 


每 个 试 次 的 流程 如 图 4 所 示 。 首 先 ， 在 屏幕 中 央 呈 现 一 个 动态 的 注视 点 ， 持 续 480ms。 


之 后 ， 空 屏 300~400ms。 接 着 ， 呈 现 动画 的 第 一 帧 。300ms 后 ， 动 画 开 始 播放 ， 持 续 2s. ih 
次 间隔 为 900~1100ms。 被 试 被 要 求 认 真 观看 屏幕 中 的 动画 ， 并 计数 填充 动画 的 次 数 ， 在 每 
个 组 块 结束 后 进行 报告 。 


动态 注视 点 空 屏 动画 第 一 帧 播放 动画 试 次 间隔 
480 ms 300~400 ms 300 ms 2s 900~1100 ms 


4 
had 


实验 共有 两 个 组 块 ， 每 个 组 块 包含 72 个 正式 试 次 ， 甚 中 每 个 条 件 包 含 36 个 试 次 。 每 个 
条 件 36 个 试 次 动画 中 的 智能 体 组 合 均 不 相同 ， 但 条 件 间 的 智能 体 组 合 均 相同 。 如 此 ， 不 同 
条 件 间 除了 情境 ， 其 它 的 物理 信息 均一 致 。 在 前 述 设置 的 基础 上 ， 每 个 组 块 还 包括 8~12 个 
填充 动画 ， 其 用 于 注意 检测 。 如 果 被 试 所 报告 的 填充 动画 个 数 与 真实 的 不 一 致 ， 则 说 明 该 被 
试 可 能 未 认真 观看 所 有 的 视频 。 根 据 该 注意 检测 标准 ， 被 试 均 能 准确 报告 填充 动画 个 数 。 
2.4 数据 记录 
基于 NeuroScan Synamps 2 系统 (Compumedics NeuroScan Inc.)， 利 用 国际 通用 的 10~20 
的 64 导 Ag/AgCl 电极 帽 记录 EEG。 以 左 侧 乳 突 电极 为 参考 。 接 地 电极 位 于 FPZ 与 FZ 中 
央 。 以 左 眼 眶 额 上 、 下 部 的 2 个 电极 记录 垂直 眼 电 (VEOG)， 以 两 眼 外 侧 1.5cm 处 的 2 个 
极 记 录 水 平 眼 电 (HEOG)。 脑 电信 号 采集 增益 为 500, 采样 频率 为 500Hz, 滤波 带 通 (band-pass) 
为 0.05~100Hz。 电 极 和 头皮 间 的 电阻 均 小 于 SKO. 

2.5 数据 分 析 

采用 MATLAB 的 EEGLAB 和 Fieldtrip 工具 包 对 数据 进行 分 析 。 首 先 用 EEGLAB 对 数 
据 进 行 预 处 理 。 预 处 理 中 ， 先 将 左 侧 乳 突 参 考 转 换 成 左右 乳 突 平均 做 参考 , 之 后 对 数据 进行 
0.1~100HZ 的 滤波 (fir1)。 接 下 来 ， 删 除 记录 了 眼 电 的 电极 数据 ， 并 进行 独立 成 分 分 析 (ICA)。 
对 获得 的 独立 成 分 ， 采用 EEGLAB 的 ADJUSR 插件 识别 眼 电 成 分 与 噪音 成 分 ， 并 将 其 剔除 
1。 最 后 , 对 脑 电 数据 进行 分 段 , 其 长 度 为 开始 运动 前 500ms 到 运动 后 2000ms( 动 画 结束 点 )。 
完成 前 述 处 理 后 ， 采 用 Fieldtrip 进行 频谱 分 析 。 具 体 而 言 ， 对 每 个 分 段 数 据 ， 首 先 就 4~30 
Hz 的 节律 ， 以 0.5Hz 为 步 长 进行 Morlet 小 波 分 析 (wavelet)， 其 带宽 为 3Hz; 之 后 ， 以 运动 


开始 前 500ms 的 能 量 值 作为 基线 (此 时 间 长 度 可 保证 包含 目标 分 析 频 段 至 少 三 个 完整 的 波 


E| 


ca 


<} 


1 笔者 也 采用 传统 的 分 析 方法 剔除 噪音 试 次 , 即 波幅 超过 +100kV KRAAI, 在 出 
进行 分 析 ， 其 结果 与 采用 ADJUSR 插件 删除 噪音 法 所 得 结果 相同 。 


Er 


基础 上 对 u 频段 能 量 


长 )， 对 每 个 分 段 数据 ( 即 开 始 运动 前 500ms 至 开始 运动 后 2000ms) 的 能 量 


最 后 ， 对 每 个 被 试 按 条 件 进行 平均 。 


与 已 有 研究 一 致 ， 本 实验 选取 的 由 频 段 为 8~13Hz(Fox et al., 2016; 


my 


进行 基线 矫正 ; 


Muthukumaraswamy 


et al., 2004; Ulloa & Pineda, 2007)。 大 量 研 究 表 明 ， 与 动作 加 工 相 关 的 波段 主要 出 现在 顶 


叶 运 动 区 ， 在 脑 电 研究 中 常常 选取 顶 叶 的 C3 和 C4 电极 (Duan et al., 2018; Pomiechowska & 
Csibra, 2017)， 因 此 本 实验 也 选取 C3 和 C4 电极 对 频段 的 激活 模式 进行 分 析 。 鉴 于 每 个 被 
试 由 于 头皮 厚度 不 同 以 及 电阻 不 同 可 能 导致 上 频段 激活 的 差异 (Pineda & Oberman, 2006), ff 
鉴 已 有 研究 (Cuevas et al., 2014; Pfurtscheller & Silva, 1999)， 将 动画 呈现 阶段 的 4 频段 能 量 值 


减 去 基线 的 能 量 值 并 除 以 基线 的 能 量 值 再 乘 100% 作 为 的 能 量 值 。 即 对 于 每 个 被 试 ， 因 变 


量 =( 动 画 呈 现 阶 段 的 A 频段 能 量 -基线 


< 


介 段 的 上 频段 能 量 )/ 基 线 阶 段 的 员 


频段 能 量 x100%, 其 


值 小 于 零 表示 抑制 。 为 进一步 检验 p 频段 是 否 属于 枕 叶 a 活动 的 泛 化 ， 参 考 以 往 研究 


(Klimesch et al., 2007; Perry et al., 2011)， 本 实验 对 枕 叶 O1 和 O2 电极 


上 的 a 也 了 予以 类 似 分 


析 ， 结 果 发 现 两 个 实验 中 不 同类 型 动画 所 诱发 的 枕 叶 a 活动 并 无 差异 


https://osf.io/jfvxu/?view_only=c76000bc9a4b4f009151638441e79c99 获取 


的 时 间 段 ， 故 以 该 时 间 窗 的 平均 能 量 作为 因 变 量 。 


( 详 见 附录 ， 其 可 在 


)。 鉴 于 动态 智能 体 


(智能 体 A) 在 运动 开始 后 600~1000ms 趋 近 不 同 的 对 象 ， 且 是 不 同 条 件 下 运动 模式 出 现 差 异 


在 开展 本 文 所 报告 的 被 试 间 设 计 实验 前 , 笔者 也 采用 被 试 内 设计 收集 了 10 个 被 试 (结果 
见 附录 )。 但 每 个 被 试 均 报告 有 无 栅栏 情境 对 比 明 显 ， 实 验 者 设置 栅栏 是 有 目的 的 ， 因 此 调 


整 成 了 被 试 间 设 计 。 更 重要 的 是 ， 对 于 智能 体 A 将 苹果 放置 在 智能 体 B 前 ， 有 无 栅栏 情境 


在 物理 层面 存在 差异 (栅栏 的 遮挡 不 同 )， 直 接 对 比 所 发 现 的 上 抑制 差异 可 被 物理 层面 的 影响 


所 解释 。 因 此 ， 将 是 否 存在 栅栏 时 智能 体 A 将 苹果 放置 在 智能 体 B 前 分 别 与 控制 条 件 进行 


比较 ， 即 目前 的 被 试 间 设 计 。 
2.6 结果 与 讨论 


不 同 条 件 下 在 不 同 电极 上 诱发 的 8~13Hz 频段 能 量 及 其 差异 地 形 图 如 图 5 和 6 所 示 。 对 


u 相对 能 量 值 进行 2( 电 极 : C3 与 C4)x2( 放 置 目的 地 : 智能 体 与 石头 ) 的 


结果 发 现 : 仅 有 放置 目的 地 的 主 效应 显著 , FC, 19)= 8.71, p=0.008, n = 


重复 测量 方差 分 析 ， 


0.31, 差异 的 95%CI 


=[-15.1%, -2.6%]， 其 中 当 动 态 智 能 体 将 苹果 放置 在 静态 智能 体 (智能 体 B) 前 时 ， 频段 能 量 


(M=-17.3%, SE = 3.6%) 显 著 强 于 (抑制 程度 更 高 ) 将 其 放置 在 静态 石头 前 的 上 频段 能 量 CKM = 


-8.5%, SE=4.6%); 电极 的 主 效应 不 显著 ，F(1, 19) =0.80, p= 0.382, n} =0.04, ASEH 95%CI 


=[-9.5%, 3.8%]; 电极 与 放置 目的 地 的 交互 作用 不 显著 ，F(1, 19) <0.01, p=0.975, n, <0.01. 
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实验 一 
存在 栅栏 的 情境 


实验 二 
不 存在 家 栏 的 情境 


C3 C4 C3 C4 


相对 能 量 值 (%) 


a 2 

图 5 实验 一 和 实验 二 中 顶 叶 8~13Hz 频段 相对 能 量 值 (误差 线 代表 标 准 误 ) 

对 所 有 电极 上 的 8~13Hz 频段 能 量 ， 采 用 基于 Cluster 的 置换 检验 (permutation test; Maris 
& Oostenveld, 2007)， 其 中 使 用 蒙特 卡 洛 模拟 法 ， 并 将 抽样 次 数 设置 为 5300， 且 要 求 至 少 相 邻 
的 两 个 电极 在 苹果 被 放置 至 不 同 目 的 地 时 8~13Hz 频段 能 量 差异 上 达到 显著 。 结 果 依然 发 现 
C3 和 C4 电极 上 ， 苹 果 被 放置 在 智能 体 前 时 po 频段 抑制 程度 显著 高 于 苹果 被 放置 在 石头 前 
面 的 条 件 ， 而 01 与 02 上 则 无 差异 ， 其 存在 差异 的 电极 如 图 6c 所 示 。 故 上 述 基于 方差 分 析 
的 结果 并 不 能 由 所 选择 电极 的 特殊 性 所 解释 。 

上 述 结 果 发 现 ， 当 智能 体 B 被 栅栏 围 住 时 ， 智 能 体 A 将 苹果 放置 在 智能 体 B AET u fH 
制 强 于 控制 条 件 一 一 智能 体 A 将 苹果 放置 在 石头 前 , 且 并 非 a 活动 的 泛 化 , 其 与 预测 一 致 ， 
支持 成 本 最 小 化 信息 是 社会 性 意图 识别 重要 线索 的 观点 。 
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实验 一 中 8~13Hz 能 量 差 异地 形 图 实验 二 中 8~13Hz 能 量 差异 地 形 图 
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基于 Cluster 的 置换 检验 


图 6 有 无 栅栏 情境 下 实验 1(a) 和 实验 2(b) 中 8~13Hz 频段 的 差异 地 形 图 以 及 (c) 基 于 Cluster 置换 检验 的 地 形 医 
GE: c RI 中 符号 x 表示 存在 显著 差异 的 电极 ) 


3 实验 二 


实验 一 中 当 智 能 体 A 将 苹果 放置 在 智能 体 B 前 时 , 智能 体 A 的 动作 可 减少 智能 体 B 完 
成 目标 的 动作 成 本 ， 即 符合 成 本 最 小 化 条 件 ，h 的 抑制 程度 显著 高 于 被 识别 为 客体 导向 性 意 
图 的 控制 条 件 。 针 对 该 结果 ， 可 能 也 仅仅 是 一 个 智能 体 趋 近 另 一 个 智能 体 ， 而 非 成 本 最 小 化 
言 息 ， 导 致 其 被 识别 为 社会 性 意图 。 本 实验 将 通过 去 除 成 本 最 小 化 信息 的 方法 ,对 这 一 可 能 
性 进行 检验 。 实 验 中 ， 智 能 体 A 与 实验 一 保持 相同 的 运动 特性 ， 但 将 实验 一 中 围 住 智能 体 
B 和 石头 的 栅栏 移 除 ， 使 得 智能 体 B 获得 苹果 的 成 本 小 于 智能 体 A 将 苹果 放置 在 其 前 面 的 
成 本 ( 即 不 符合 成 本 最 小 化 )。 若 人 们 确实 基于 成 本 最 小 化 信息 这 一 线索 识别 社会 性 意图 ， 则 
当 智 能 体 A 将 苹果 放置 在 未 被 栅栏 围 住 的 智能 体 B 前 时 ， 即 不 符合 成 本 最 小 化 ， 实 验 一 的 
效应 消失 ; 反之 , 若 效应 依然 存在 , 则 说 明智 能 体 之 间 社 会 性 意图 识别 取决 于 其 它 线索 , 如 : 
趋 近 智能 体 的 行为 。 

3.1 方法 

20 名 在 校 大 学 生 自愿 参与 本 实验 (其 中 男性 8 名 ， 女 性 12 名 )。 被 试 的 年 龄 在 17~24 岁 
之 间 (M= 19.9, SE = 0.4)， 视 力 或 矫正 视力 正常 ， 无 色盲 ， 均 无 身心 疾病 。 

实验 设计 和 流程 与 实验 一 基本 相同 ， 除 了 趋 近 的 目标 物 (智能 体 或 石头 ) 前 面 的 栅栏 不 存 
在 (如 图 3c 与 图 3d 所 示 )。 数 据 采集 与 分 析 与 实验 一 相同 。 


3.2 结果 


a 


不 同 条 件 下 诱发 的 8~13Hz 频段 能 量 ， 及 其 条 件 间 差异 地 形 图 如 图 5 和 图 6 所 示 。 以 上 
频段 相对 能 量 为 因 变量 ，2( 电 极 : C3 与 C4)x2( 放 置 目的 地 : 智能 体 与 石头 ) 的 重复 测量 方差 


分 析 发 现 ， 电极 的 主 效应 不 显著 ，F(1, 19) = 2.96, p = 0.101, 位 = 0.14， 差 异 的 95%CI = [- 


10.3%, 1.0%]; 放置 目的 地 的 主 效应 不 显著 , F(1, 19)=0.18, p= 0.677, 13 <0.01, 差异 的 95%CI 


=[-7.0%, 10.5%]; 二 者 的 交互 作用 也 不 显著 ，F(1, 19) = 0.49, p = 0.494, 7, = 0.03。 采 用 与 实 
验 一 相同 的 基于 Cluster 的 置换 检验 ， 结 果 未 发 现 有 任何 电极 在 不 同 条 件 间 的 8~13Hz 能 量 
存在 显著 差异 。 

为 进一步 检验 实验 一 的 结果 确实 由 于 动作 识别 的 差异 所 致 ， 合 并 C3 和 C4 电极 上 的 数 
据 ， 形 成 2 实验: 实验 一 与 实验 二 ; 被 试 间 变量 )x2( 放 置 目 的 地 : 智能 体 与 石头 ; 被 试 内 变 
量 ) 的 实验 设计 ， 对 顶 叶 的 频段 能 量 进行 方差 分 析 。 结 果 发 现 ， 实 验 的 主 效应 不 显著 ,，F(1， 


38) = 1.33, p = 0.257, n, = 0.03; 放置 目的 地 的 主 效应 也 不 显著 ，F(1, 38) = 1.90, p = 0.176, n 


lin 


= 0.05; 但 两 因素 的 交互 作用 显著 ，F(1, 38) = 4.27, p = 0.046, 人 = 0.10。 且 就 智能 体 ASE 


果 放 置 在 智能 体 B 前 ， 存 在 栅栏 时 所 诱发 的 po Hii 
栅栏 的 情境 (M = -4.8%, SE = 5.6%; 1(38) = 1.89, p = 0.034, Cohen’s d = 0.60， 其 为 单 尾 检验 )， 


—, 


显著 (M = -17.3%, SE = 3.6%) 强 于 不 存在 


而 在 智能 体 A 将 苹果 放置 在 石头 前 时 该 差异 消失 (t(38) = 0.28, p = 0.390, Cohen’s d = 0.09). 
该 结果 提示 实验 操纵 调节 不 同 动作 模式 下 项 叶 的 pj 频段 能 量 ， 进 一 步 支持 实验 一 的 结果 确 
实 由 于 动作 识别 结果 的 不 同 所 致 。 


4 实验 三 a 


本 实验 呈现 与 实验 1 相同 的 动画 , 但 采用 变化 觉察 范式 , 基于 信号 检测 论 测量 被 试 对 不 
同 变化 的 辨别 力 ， 考 察 是 否 存 在 记忆 混淆 效应 ， 以 进一步 检验 研究 假设 。 
4.1 被 试 

保持 与 前 述 研究 相同 的 样本 量 ，20 名 在 校 大 学 生 自 愿 参与 本 实验 (其 中 男性 7 名 ， 女 性 
13 名 )。 被 试 的 年 龄 在 17~24 岁 之 间 (M=21.2,SE=0.3)， 视 力 或 矫正 视力 正常 ， 无 色盲 ， 均 
无 身心 疾病 。 
4.2 实验 材料 与 流程 

实验 的 刺激 材料 与 实验 一 相同 ， 但 流程 改 为 变化 觉察 范式 (如 图 7 所 示 )。 具 体 而 言 ， 首 
先 ,在 屏幕 中 央 呈 现 一 个 动态 的 注视 点 ， 持 续 480ms 之 后 ， 空 屏 300~400ms。 接 着 ,在 白 框 
中 (11.1°x 8.39) 依 次 播放 4 个 需要 记忆 的 相同 模式 的 动画 作为 记忆 项 ， 每 个 持续 2000ms， 两 
者 之 间 有 1000ms 的 空 屏 间 隔 。 随 后 ， 再 呈现 一 个 动画 ， 并 伴随 着 白色 边框 变 为 红 框 以 提醒 
被 试 在 呈现 检测 项 ， 其 持续 2000ms。 在 检测 项 消失 后 ， 要 求 被 试 尽 可 能 准确 地 判断 检测 项 
是 否 在 记忆 项 中 出 现 过 。 如 果 检 测 项 与 某 个 记忆 项 相同 ， 则 要 求 被 试 按 下 “J” 键 ; 否则， 
按 下 “F” 键 。 如 果 在 2000ms 内 未 按键 ， 程 序 会 自动 进入 下 一 个 试 次 。 每 个 试 次 间隔 为 


1500ms. 
动态 注视 点 空 屏 动画 空 屏 动画 按键 反应 
480 ms 300~400 ms 2000 ms lr 1000 ms 2000 ms 2000 ms 


| 
hs | 


记忆 项 检测 项 
播放 4 次 不 同 动画 判断 该 动画 是 否 出 现 过 


图 7 实验 三 流程 示意 图 

每 个 试 次 中 ， 所 有 记忆 项 和 检测 项 的 动作 模式 相同 ( 即 运动 路 径 以 及 是 将 苹果 放置 在 智 
能 体 前 还 是 石头 前 )， 但 每 个 记忆 项 都 是 一 对 外 观 不 同 的 智能 体 ， 其 具有 不 同 的 外 观 。 在 检 
测 项 中 ,基于 智能 体外 观 的 变化 可 区 分 为 三 种 条 件 ， 如 图 8 所 示 : (无 变化 ， 呈 现 与 某 个 记 
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忆 项 相同 的 一 对 智能 体 ， 且 智能 体 的 角色 保持 一 致 (也 即 随机 抽取 一 个 记忆 项 作为 检测 项 ); 
CO) 角色 交换 ， 检 测 项 中 智能 体 来 自 茶 个 记忆 项 ， 但 智能 体 的 角色 互 换 ( 即 A 将 苹果 放置 在 智 
能 体 B 前 变 成 B 将 苹果 放置 在 智能 体 A 前 )，(3) 结 构 改 变 ， 记 忆 项 中 茶 两 个 动画 中 占据 相 
同 角 色 的 智能 体 互 换 ( 即 A 将 苹果 放置 在 智能 体 B 前 和 C 将 苹果 放置 在 智能 体 D 前 ， 变 为 
C 将 苹果 放置 在 智能 体 B 前 )。 据 此 ， 由 于 记忆 和 检测 项 的 动作 模式 相同 ， 被 试 只 需 根据 动 
画 中 两 个 智能 体 的 外 观 来 判断 动画 的 变化 , 从 而 可 以 检测 被 试 对 动画 中 的 两 个 智能 体 是 否 进 
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图 8 实验 三 不 同 条 件 示意 图 
GE: 字母 “A” 到 “H” 代 表 不 同 的 智能 体 ， 字 母 “R” 代 表 石 头 。) 

为 平衡 每 种 变化 类 型 下 的 试 次 数量 ， 无 变化 条 件 下 的 试 次 等 于 角色 交换 和 结构 改变 条 件 
的 试 次 之 和 。 对 于 无 变化 条 件 下 的 试 次 ， 一 半 的 试 次 被 视 为 没有 角色 交换 ， 另 一 半 被 视 为 没 
有 结构 改变 。 事 实 上 , 在 无 角色 交换 和 无 结构 改变 条 件 之 间 没 有 区 别 ， 只 是 作为 后 续 数据 分 
析 的 区 分 。 上 述 变化 条 件 均 出 现在 目标 物 放 置 在 智能 体 前 或 石头 前 这 两 个 条 件 下 。 每 个 条 件 
有 20 个 试 次 ， 结 果 总 共 160 个 试 次 ， 共 分 为 4 组 ， 每 组 结束 后 休息 5 分 钟 。 所 有 试 次 以 伪 
随机 顺序 呈现 ， 在 连续 三 次 试 次 中 不 重复 相同 的 条 件 。 

4.3 数据 分 析 

为 检验 记忆 混淆 效应 ， 即 放置 目的 地 (智能 体 与 石头 ) 是 否 会 调节 被 试 对 不 同 变化 的 敏感 
性 ， 根 据 信 号 检测 论 ， 以 “检测 项 与 所 有 记忆 项 不 同 ”( 即 变化 ) 作 为 信号 和 “检测 项 与 某 个 
记忆 项 相同 ”( 即 无 变化 ) 作 为 噪音 ， 计 算 不 同 变化 类 型 下 的 敏感 性 指标 4 ， 即 辨别 力 (Yin et 
al., 2018)。 为 了 避免 在 计算 d 时 出 现 无 限 大 的 情况 ， 参 考 Snodgrass 和 Corwi(1988) 的 建议 ， 
对 每 种 变化 类 型 下 所 统计 击 中 、 漏 报 、 虚 报 和 正确 拒 斥 的 频次 均 加 0.5, 且 除 以 N+1。 其 中 ， 
N 为 对 应 条 件 下 频次 。 据 此 ， 可 获得 2( 变 化 类 型 : 角色 交换 与 结构 改变 )x2( 放 置 目 的 地 : 短 
能 体 与 石头 ) 的 被 试 内 设计 的 辨别 力 ， 对 其 进行 重复 测量 方差 分 析 。 此 外 ， 对 基于 信和 号 检测 
论 计算 所 得 的 决策 标准 B 也 进行 了 报告 ， 详 见 附录 。 
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4.4 结果 

不 同 条件 下 的 辨别 力 如 图 9 所 示 。 对 辨别 力 进行 2( 变 化 类 型 : 角色 交换 与 结构 改变 )x2( 放 
置 目的 地 : 智能 体 与 石头 ) 的 重复 测量 方差 分 析 ， 结 果 发 现 : 变化 类 型 的 主 效应 不 显著 ，F1， 
19) = 1.12, p = 0.304, n = 0.06; 放置 目的 地 的 主 效应 不 显著 ，F(1, 19) = 0.11, = 0.746, n < 
0.01; 但 变化 类 型 与 放置 目的 地 的 交互 作用 显著 ，F(1, 19) = 8.03, p = 0.011, n = 0.30。 简 单 
效应 分 析 发 现 ， 在 放置 目标 物 至 智能 体 条 件 下 ， 角 色 交 换 (M= 1.38, SE = 0.24) 的 辨别 力 显著 
低 于 结构 改变 (M = 2.04, SE = 0.21; (19) = 2.78, p = 0.012, Cohen’s d = 0.62)， 而 在 放置 目标 物 


BAKA, 角色 交换 (M= 1.97, SE= 0.25) 的 辨别 力 显 著 高 于 结构 改变 (M= 1.51,SE=0.23; 
1(19) = 2.26, p = 0.036, Cohen’s dg= 0.530)。 更 重要 的 是 ， 在 角色 交换 条 件 下 ， 被 试 对 放置 目的 
HARM = 1.97, SE = 0.25) 条 件 的 辨别 力 显著 高 于 放置 目的 地 为 智能 体 的 条 件 (M = 1.38, 
SE = 0.24; 1(19) = 2.33, p = 0.031, Cohen’s d = 0.52); 相反 ， 当 变换 类 型 为 结构 改变 时 ， 放 置 


目的 地 为 智能 体 条 件 下 (M = 2.04, SE = 0.21) 辨 别 力 显著 高 于 放置 目的 地 为 石头 的 条 件 (M = 


1.51, SE = 0.23; (19) = 3.21, p = 0.005, Cohen’s d = 0.72)， 呈 现 记 忆 混 淆 效应 。 


3.0 口 放 置 目标 物 至 智能 体 
国 放 置 目标 物 至 石头 


PEN II’) 


角色 交换 结构 改变 角色 交换 结构 改变 


ays 


实验 三 a 实验 三 b 
存在 栅栏 的 情境 不 存在 栅栏 的 情境 


图 9 实验 三 a 和 实验 三 b 中 不 同 条 件 下 辨别 力 d (误差 线 代表 标准 误 ) 


5 实验 三 b 


为 进一步 检验 成 本 最 小 化 信息 的 作用 ， 与 实验 二 相同 ， 实 验 三 b 将 去 除 成 本 最 小 化 信 


息 ， 观 察 实验 三 a 的 效应 是 否 消失 。 


5.1 方法 
20 名 在 校 大 学 生 自愿 参与 本 实验 (其 中 男性 7 名 ， 女 性 13 名 )。 被 试 的 年 龄 在 17~24 岁 
之 间 (M= 20.1, SE = 0.4)， 视 力 或 矫正 视力 正常 ， 无 色盲 ， 均 无 身心 疾病 。 


实验 设计 和 流程 与 实验 三 a 基本 相同 ， 除 了 趋 近 的 目标 物 (智能 体 或 石头 ) 前 面 的 栅栏 不 
存在 。 数 据 分 析 与 实验 三 a 相同 。 


不 同 条 件 下 的 辨别 力 如 图 9 所 示 。 对 辨别 力 进 行 2( 变 化 类 型 : 角色 交换 与 结构 改变 )x2( 放 
置 目的 地 : 智能 体 与 石头 ) 的 重复 测量 方差 分 析 , 结果 发 现 : 变化 类 型 的 主 效应 显著 , F(1, 19) 


= 8.14, p=0.010, $ = 0.30， 角 色 交 换 条 件 CQM= 2.09, SE = 0.25) 的 辨别 力 显著 高 于 结构 改变 (AM 


HI 四 


= 1.42, SE=0.22); 放置 目的 地 的 主 效应 不 显著 ，F(1, 19) = 0.48, p = 0.495, nè = 0.03; 变化 类 


型 与 放置 目的 地 的 交互 作用 不 显著 ，F(1, 19) = 0.64, p = 0.434, rÈ = 0.03. 


6 讨论 

本 研究 针对 视觉 可 利用 哪些 信息 对 社会 性 (交互 ) 意 图 进行 识别 的 问题 ， 提 出 当 菜 个 体 A 
协助 另 一 个 体 B 达 成 目标 状态 所 需要 的 成 本 小 于 个 体 B 单独 达成 目标 状态 所 需要 的 成 本 (成 
本 最 小 化 信息 ) 时 ， 视 觉 系统 会 将 其 识别 为 动作 发 出 方 对 受益 方 存在 以 交互 为 目的 的 社会 性 
意图 。 为 检验 该 假设 ， 呈 现 智能 体 A 将 苹果 放置 在 智能 体 B 前 面 或 石头 前 面 的 动画 ， 并 通 
过 在 智能 体 B 前 面 设置 障碍 物 ( 即 B 是 否 被 栅栏 围 住 ) 的 方法 操纵 成 本 最 小 化 信息 ， 以 四 项 
实验 探讨 了 成 本 最 小 化 信息 是 否 是 社会 性 意图 识别 的 线索 。 结果 显示 , 相 比 被 识别 为 客体 导 
向 性 意图 的 控制 条 件 ( 即 A 将 目标 物 苹果 放置 在 石头 前 )， 当 A 将 目标 物 苹果 放置 在 被 顶 栏 


> 挡住 的 B 前 , 其 动作 可 减少 B 单独 获取 该 苹果 的 动作 成 本 , 即 符合 成 本 最 小 化 条 件 时 ,4 的 
© 抑制 程度 更 高 (实验 一 )， 且 对 结构 改变 ( 茶 两 个 动画 中 充当 相同 角色 的 智能 体 互 换 ) 的 辨别 力 
= 更 强 , 但 对 角色 交换 ( 某 个 动画 中 两 个 智能 体 的 角色 交换 ) 的 辨别 力 更 弱 ( 实 验 三 a); 而 当 栅 栏 
G 不 存在 时 ， 虽 然 A 的 运动 路 径 与 实验 一 相同 , 但 A KERKEE B 前 的 成 本 大 于 B 自身 获 


取 苹 果 的 成 本 ， 即 不 符合 成 本 最 小 化 条 件 ， 条 件 间 上 抑制 的 差异 消失 (实验 二 )， 且 对 不 同 动 
作 模 式 中 变化 的 辨别 相当 (实验 三 b)。 

针对 导致 p 抑制 差异 的 可 能 原因 , 本 研究 设置 了 严格 的 控制 条 件 ， 以 确保 其 只 能 被 意图 
识别 结果 的 不 同 所 解释 。 首 先 ， 鉴 于 存在 栅栏 和 不 存在 栅栏 时 智能 体 A 将 苹果 放置 在 智能 
体 B 前 的 物理 差异 不 同 (栅栏 的 存在 以 及 对 智能 体 B 的 遮挡 程度 不 同 ), p 的 抑制 程度 差异 可 
能 反应 了 物理 层面 的 差异 ， 因 此 实验 中 分 别 将 其 与 各 自 的 控制 条 件 一 一 智能 体 A 将 苹果 放 
置 在 石头 前 进行 对 比 。 该 设计 一 方面 可 更 好 的 排除 物理 差异 的 解释 : 因 被 试 所 看 到 的 差异 仅 
是 智能 体 A 运动 朝向 的 不 同 ， 通 过 随机 化 设置 可 在 条 件 间 保持 平衡 ， 故 出 现 u 激活 程度 的 
差异 只 能 由 A 将 苹果 放置 在 B 前 所 蕴含 的 特殊 信息 所 致 ， 另 一 方面 ， 控 制 条 件 智 能 体 A 将 


苹果 放置 在 石头 前 属于 典型 的 客体 导向 性 意图 ， 可 为 实验 条 件 一 一 智能 体 A 将 苹果 放置 在 
智能 体 B 前 提供 解释 基线 : 若 后 者 u 激活 程度 与 控制 条 件 相 当 ， 则 可 说 明 其 也 被 识别 为 客 
体 导向 性 意图 ， 而 后 者 激活 程度 高 于 控制 条 件 ， 则 可 说 明 其 被 识别 为 社会 性 意图 。 再 者 ， 
对 于 成 本 化 最 小 化 信息 进行 了 直接 操纵 (实验 一 与 实验 二 )， 结 果 发 现在 不 存在 成 本 最 小 化 信 
息 (不 存在 栅栏 ) 时 ， 实 验 条件 一 一 智能 体 A 将 苹果 放置 在 智能 体 B 前 ， 与 控制 条 件 一 一 智 
能 体 A 将 苹果 放置 在 石头 前 激活 程度 相当 ， 揭 示 了 实验 一 条 件 间 册 激活 程度 的 差异 确 是 
由 于 意图 识别 结果 的 不 同 所 致 。 这 一 结果 不 仅 重 复 了 Yin 等 (2020) 发 现 的 上 激活 程度 随 着 社 

会 性 意图 的 增强 而 提升 的 结果 ， 且 进一步 扩展 了 Yin 等 人 的 研究 , 揭示 了 适用 于 社会 性 意图 

识别 的 一 种 新 线索 (Yin et al., 2020). Yin 等 (2020) 的 研究 中 苹果 是 在 智能 体 A 的 面前 ， 且 无 

论 是 A 转移 苹果 的 成 本 还 是 B 自己 拿 苹果 的 成 本 都 相同 ， 而 关键 是 智能 体 A“ 将 自己 的 物 
> 品 转移 至 他 人 ”这 一 线索 引发 了 社会 性 意图 的 识别 , 而 本 研究 并 无 “将 自己 的 物品 转移 至 他 
人 ”的 动画 设置 ， 而 对 成 本 最 小 化 这 一 线索 进行 了 操纵 。 


= 


除 采 用 脑 电 指标 对 感知 到 的 意图 类 型 进行 考察 , 本 研究 还 基于 变化 觉察 范式 , 采用 信和 号 
o; 检测 论 测量 被 试 对 不 同 变化 的 敏感 性 。 对 于 存在 社会 性 意图 的 两 个 智能 体 的 记忆 , 已 有 研究 
= 证 明 其 可 被 整合 成 一 个 记忆 分 组 单元 (Stahl & Feigenson, 2014; Vestner et al., 2019; Ding et al., 
= 2017)， 因 此 人 们 更 容易 辨别 其 结构 改变 ， 而 对 角色 交换 不 敏感 ， 呈 现 记 忆 混 淆 效应 。 这 一 


~ 记忆 效应 出 现在 了 当 智 能 体 A 将 苹果 放置 在 被 栅栏 围 住 的 智能 体 B 前 ， 提 示 其 被 识别 为 具 
x 有 社会 性 意图 ,进一步 验证 了 基于 脑 电 获得 的 结论 。 而 当 栅栏 被 去 除 后 ， 即 去 除 成 本 最 小 化 
信息 ， 仅 发 现 对 角色 交换 的 辨别 力 高 于 结构 变化 ,其 与 存在 栅栏 时 对 实验 三 a 中 控制 条 件 不 
同 变化 的 辨别 相当 。 究 其 原因 ， 动 画 中 的 施 动 者 (智能 体 A) 是 运动 的 ， 而 受 动 者 (智能 体 B) 
保持 静止 ， 当 智能 体 间 不 存在 社会 性 意图 或 社会 性 意图 较 弱 时 ， 二 者 并 未 被 记忆 分 组 ， 而 是 
以 单个 智能 体 进 行 存储 。 如 此 ， 当 运动 的 智能 体 变 为 静止 的 智能 体 时 ， 物 理 状 态 发 生 了 较 大 
改变 ， 从 而 使 得 被 试 更 容易 辨别 。 然 而 ， 这 一 现象 在 存在 成 本 最 小 化 信息 的 条 件 中 (智能 体 
A 将 苹果 放置 在 被 栅栏 围 住 的 智能 体 B 前 ) 弱 化 ， 甚 至 反 转 ， 进 一 步 说 明了 其 被 识别 为 具有 
社会 性 意图 ， 从 而 产生 记忆 分 组 。 

本 研究 发 现 茶 智 能 体 将 苹果 放置 在 另 一 智能 体 前 (不 存在 成 本 最 小 化 信息 )， 其 被 识别 为 
不 具有 社会 性 意图 ， 其 似乎 与 生活 经 验 相悖 。 经 验 上 ， 只 要 两 个 人 之 间 发 生 接 触 ， 就 极 有 可 
能 被 解释 为 存在 社会 性 意图 。 但 该 经 验 化 解释 往往 具备 一 定 的 前 提 : 双方 都 有 行为 上 的 外 显 
反应 ,或 即使 男 一 方 无 行为 上 的 反应 ， 也 会 赋予 内 部 心理 的 变化 ， 如 : 他 内 心 嫉 恨 对 方 。 但 
在 人 们 的 日 常 经 验 中 所 涉及 的 多 是 有 外 显 反应 的 交互 双方 (如 握手 )， 其 存在 社会 性 意图 识别 


五 


中 的 另 一 重要 线索 


耦合 性 线索 ， 所 以 会 被 解释 为 存在 社会 性 意图 。 就 第 一 个 可 能 前 


前 提 ， 


本 研究 中 只 有 一 方 有 行为 反应 ( 即 运动 )， 而 另 一 方 永 远 静 止 ， 因 此 很 难 满足 。 针 对 第 二 个 可 
能 前 提 , 实验 二 中 智能 体 A 将 苹果 放置 在 智能 体 B 前 确实 可 认为 A 想 与 B 交互 , 但 B 不 愿 


意 , 但 这 一 解释 强烈 依赖 于 对 他 人 的 心智 进行 经 验 反 


E 测 ， 且 强烈 依赖 于 个 人 的 经 验 , 不 具有 


推理 结果 的 稳定 性 ， 因 为 不 同人 有 不 同 的 解释 。 其实, 深入 分 析 也 可 发 现 将 目标 物 放置 在 茶 
人 面前 并 不 代表 有 社会 性 意图 ， 如 : 考试 开始 前 学 生 将 书本 放 在 老师 所 在 的 讲台 前 。 为 何 会 


产生 不 同 层面 的 解释 ? 这 与 人 类 对 行为 理解 的 认 知 系统 有 关 。 人 类 对 行为 天 
认为 分 为 心智 化 表 生 
Gergely & Csibra, 2003)。 前 者 基于 对 他 人 可 能 心理 状态 的 推测 ， 以 解释 他 人 的 动作 ， 其 
于 经 验 对 心理 状态 的 有 意思 考 ， 如 : 即使 看 到 某 人 表面 上 对 他 人 行为 友善 , 观察 者 可 认为 这 
因此 难以 成 为 社会 性 意图 推理 中 的 通用 线索 ， 其 因 人 而 异 。 而 后 者 基 


个 人 内 心 想 加 害 他 人 ， 


E 解 的 认 知 系统 被 


E (mentalistic representation) 和 目的 论 表 征 (teleological representation; 


A ii 


于 可 被 直接 观察 的 要 素 ， 如 : 情境 的 约束 、 动 作 的 成 本 和 收益 等 这 些 可 容易 观察 到 的 要 素 ， 


观察 至 


N 


基于 效用 最 大 化 原则 对 他 人 的 动作 意图 i 
县 可 成 为 人 们 识别 动作 的 习 


1 的 信 


行 推测 , 其 具有 自动 化 加 工 特性 , 不 需要 任务 引导 ， 


EE 要 线索 之 一 (Buon et al., 2013)。 本 研究 中 ， 被 试 不 


需要 有 意 对 所 观察 到 的 动作 进行 推理 , 而 是 被 动 地 观察 并 计数 可 能 的 填充 试 次 , 更 多 依赖 于 


对 动作 的 目的 论 表 征 。 


基于 该 表征 ， 检 测 到 可 依赖 的 线索 一 一 社会 性 意图 识别 的 充分 条 件 ， 
即 成 本 最 小 化 信息 ， 从 而 将 其 识别 为 具有 社会 性 意图 。 但 针对 这 一 识别 过 程 ， 若 成 本 最 小 化 


信息 缺失 , 人 们 可 能 还 会 搜寻 其 他 可 依赖 的 线索 , 甚至 受到 个 人 对 他 人 心智 推测 经 验 的 影响 ， 


后 续 研 究 这 些 问题 进 
本 研究 以 动画 的 形式 模拟 动作 , 可 对 动作 发 生 的 情境 进 
行 严格 控制 ， 此 方法 已 被 广泛 应 用 于 动作 理解 领域 。 但 该 方法 所 设置 的 动作 对 人 类 的 动作 进 


步 探讨 。 


行 有 效 操 纵 , 且 可 对 额外 变量 进 


控制 交互 双方 的 动作 成 本 ， 本 研究 对 成 本 最 小 化 信息 的 操纵 主要 以 智能 体 B 实现 目标 的 路 


径 长 短 实现 ， 后 续 研 究 可 进一步 操作 智能 体 B 获取 目标 的 路 径 长 度 ， 并 采用 心理 物理 
取 成 本 和 收益 相同 的 了 


法 获 


的 普遍 性 。 


7 结论 


本 研究 通过 设置 


本 是 否 4 


\ 于 个 体 B 单 


独 实现 该 目标 状态 所 需要 的 成 本 ， 即 是 否 存 在 成 本 最 小 化 信息 ， 


E 观 等 值 点 ， 以 此 区 分 成 本 最 小 化 信息 的 分 割 点 ,从 而 检验 本 研究 结论 


障碍 物 的 方法 操纵 当 个 体 A 协助 男 一 个 体 B 达成 目标 状态 所 需要 的 成 


以 指 
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示 不 同意 图 类 型 的 脑 电 u 以 及 对 不 同 变 化 的 辨别 力 为 指标 ， 探 讨 了 人 们 是 否 利用 成 本 最 小 
化 信息 对 社会 性 意图 进行 识别 , 获得 以 下 结论 : 两 个 个 体 的 行为 是 否 满足 成 本 最 小 化 影响 人 
们 对 动作 意图 的 识别 ， 揭 示 成 本 最 小 化 信息 是 识别 社会 性 意图 的 重要 线索 。 
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Abstract 


The recognition of the intentions of observed actions or behaviors is an important social 
function in the human visual system. Previous research has invested much effort into understanding 
how the human vision system recognizes object-directed intentions of actions (i.e., actions are 
implemented to approach physical objects without influencing others). However, actions are also 
directed to social entities or agents to impact others, which is defined as social intentions (or social 
interaction intentions). 

This study aimed to investigate how vision systems recognize social intentions. For the purpose 
of demonstrating that individuals involved in social interaction are rational and should maximize 
the utility of actions overall, this paper proposes the hypothesis that when the costs of Agent A 
helping Agent B to achieve the goal state are less than the costs of Agent B acting alone to achieve 
this goal state (i.e., cue of minimizing cost), these two agents are recognized with social intentions. 

To test the above hypothesis, we manipulated the theory of minimizing costs by presenting 
cartoonized animations that depict how two agents move and influence each other. Specifically, a 
movable Agent A placed an apple in front of Agent B, who is always stationary. In front of Agent B, 
a fence was either set in place or not, to operationalize the costs of Agent B achieving the target (i.e., 
the apple). In this case, when a fence was placed in front of Agent B, his path of achieving the target 
was blocked; accordingly, when Agent A pushed the apple to the front of Agent B and helped Agent 
B achieve the target, the costs of Agent B (i.e., path) to achieve the target were less than when Agent 
B achieved the target alone. However, when there was no fence in front of Agent B, the costs of 
Agent B achieving the target alone were less than the costs of Agent A helping Agent B to achieve 
the target. In brief, only when there was a fence in front of Agent B, the actions of Agent A in placing 
the apple in front of Agent B aligns with the information of minimizing costs, and can be recognized 


as a social intention; when there was no fence in front of Agent B, the object-directed intention 


should be attributed, as Agent A approached the target of the apple. To identify the recognized 
intentions of actions, we measured u suppression (electroencephalogram oscillations within the 
8~13 Hz range in the sensorimotor regions; namely, C3 and C4 channels) related to action 
understanding. It was suggested that the functional grouping of two individuals in social intentions 
should induce greater suppression of the representation of individual object-directed actions. To 
strictly control for the possible low-level differences, the action of Agent A, placing the apple in 
front of Agent B (i.e., transferring action) was paired with the action of Agent A, placing the apple 
in front of a stone (i.e., disposing action), which was typically recognized as an object-directed 
intention, whether the fence was present or not. Each action lasted two seconds, and participants 
were asked to count the fillers (i.e., incomplete actions) when watching the actions presented on the 
screen. 

In Experiment 1, when the fence was present in front of Agent B, the transferring action (M = 
-17.3% relative to the baseline) induced more u suppression than the disposing action (M = -8.5%). 
More importantly, the occipital a with the same frequency band as u was not modulated by the 
action type, but this component was suggested to be functional with attentional mechanisms. These 
results were further confirmed by cluster-based permutation tests without selecting the channels of 
interest. In Experiment 2, to test whether the effect in Experiment 1 was dependent upon the 
information of minimizing costs, the fence was removed and accordingly, the critical information 
was absent. We found that the difference in u suppression between transferring and disposing actions 
was insignificant when the fence was not present. 

To further test the hypothesis proposed in this study, we used a behavioral indicator (i.e., 
measuring the sensitivity of changes). We manipulated the information of minimizing costs, as in 
Experiments 1 and 2, but participants engaged in a change detection task. In this task, a set of 
identical actions were memorized in sequence and participants were required to detect whether 
anything changed in the test animation compared to those previously memorized. It has been 
suggested that chunking results in more efficient processing of the configuration (e.g., encoding of 
interactants’ identity), but involves a cost for the individual parts within it, resulting in a memory 
confusion effect. Hence, if Agent A is perceived as having a social intention toward Agent B, they 
should be chunked in memory. Accordingly, participants would be less likely to detect changes 


within the interaction (i.e., the roles of Agents A and B in an interaction were swapped during the 


test; defined as role swap), but would be more likely to detect changes in pair composition (i.e., the 
recipient in an interaction was replaced by the recipient from another interaction, defined as 
structure change) relative to kinematically identical non-social transferring actions. 

It was found that in Experiment 3a, when the fence was placed in front of Agent B in the role 
swap condition, participants were more sensitive to such change in the disposing action (M = 1.97, 
SE = 0.25) than to the transferring action (M =1.38, SE = 0.24); by contrast, in the structure change 
condition, the sensitivity of detecting such change in the transferring action (M = 2.04, SE = 0.21) 
was higher than that of the disposing action (M = 1.51, SE = 0.23). In Experiment 3b, when there 
was no fence in front of Agent B, participants were even more sensitive to the role swap change 
than the structure change, but it was not influenced by the action type. 

It has been widely suggested that the disposing action is attributed to an object-directed 
intention (i.e., regardless of whether the fence was present or not) and the recognized social intention 
should induce greater suppression and higher sensitivity for a structure change and lower sensitivity 
for a role swap change than the recognized object-directed intention. Hence, we concluded that the 
results, in which the transferring action induced more u suppression and higher sensitivity for a 
structure change and lower sensitivity for a role swap change than the disposing action (i.e., when 
the fence was present), were attributed to the fact that the transferring action was recognized as 
having a social intention. However, this recognition depends on the information of minimizing costs; 
otherwise, the difference in suppression and different sensitivities of changes between transferring 
and disposing actions would be observed as well, when the fence was not present. Hence, this study 
provides solid evidence that when the costs of Agent A helping Agent B to achieve the goal state are 
less than the costs of Agent B acting alone to achieve this goal state (i.e., minimizing costs), they 
are recognized with social intentions. 

Key words intention recognition, social intention, object-directed intention, minimizing costs, p 
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基于 成 本 最 小 化 信息 的 社会 性 意图 识别 : 
来 自 脑 电 和 行为 的 证 据 
附录 


1 枕 叶 o 频段 能 量 


1.1 实验 一 
不 同 条 件 下 枕 叶 a 频段 能 量 如 附 图 1 所 示 。 以 枕 叶 a 频段 能 量 作为 因 变 量 ，2( 电 极 : O1 


与 O2)x2( 放 置 目 的 地 : 智能 体 与 石头 ) 的 重复 测量 方差 分 析 结 果 发 现 : 电极 的 主 效应 (F(1, 19) 


= 0.47, p = 0.500, n =0.02)、 放 置 目的 地 的 主 效应 (F(1, 19) = 0.01, p = 0.920, n? < 0.01) 以 及 二 


者 的 交互 作用 (F(1, 19) = 0.67, p = 0.423, 13 = 0.03) 均 不 显著 。 该 结果 提示 ， 不 同类 型 动画 所 


诱发 的 能量 差异 并 非 枕 叶 a 活动 的 泛 化 。 
1.2 实验 二 


4b =E. 


不 同 条 件 下 枕 叶 a 频段 能 量 如 附 图 1 所 示 。 同 时 ,就 枕 叶 a 频段 能 量 而 言 , 2( 电 极 : O1 


与 O2)x2( 放 置 目的 地 : 智能 体 与 石头 ) 的 重复 测量 方差 分 析 未 发 现任 何 效应 显著 。 其 中 ， 电 


极 的 主 效应 (F(1, 19) = 0.24, p = 0.628, ni = 0.01)、 放 置 目 的 地 的 主 效应 (F(1, 19) < 0.01, p = 


0.957, n; < 0.01) 以 及 二 者 的 交互 作用 (F(1, 19) = 0.97, p =0.337, n = 0.05) 均 不 显著 。 


Hla 


实验 一 实验 二 
存在 顶 栏 的 情境 不 存在 栅栏 的 情境 


o1 02 O1 02 


相对 能 量 值 (%) 


口 放 置 目标 物 至 智能 体 
-30 日 放置 目标 物 至 石头 


附 图 1 实验 一 和 实验 二 中 枕 叶 8~13Hz 频段 相对 能 量 值 (误差 线 代 表 标 准 误 ) 


2 决策 标准 
2.1 实验 三 a 


就 决策 标准 ( 附 图 2) 而 言 ，2( 变 化 类 型 : 角色 交换 与 结构 改变 )x2( 放 置 目的 地 : 智能 体 与 


石头 ) 的 重复 测量 方差 分 析 并 未 发 现任 何 效 应 显著 。 其中， 变化 类 型 的 主 效应 (7(1, 19)= 3.60, 
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p= 0.073, n; = 0.16)、 放 置 目 的 地 的 主 效应 (F(1, 19) < 0.01, p = 0.953, < 0.01) VAR ZE KX 
HEHEA, 19) = 0.13, p = 0.718, i < 0.01) 均 不 显著 。 
2.2 实验 三 b 

就 决策 标准 ( 附 图 2) 而 言 ，2( 变 化 类 型 : 角色 交换 与 结构 改变 )x2( 放 置 目的 地 : 智能 体 与 
石头 ) 的 重复 测量 方差 分 析 未 发 现任 何 效应 显著 。 其 中 ， 变 化 类 型 的 主 效应 (FU 19) = 3.24, p 


=0.088, 人 Y=0.15)、 放 置 目的 地 的 主 效应 (F(1, 19) = 0.26, p = 0.618, n = 0.01D) 以 及 二 者 的 交互 


作用 (F(1, 19) = 0.16, p = 0.693, 人 < 0.01) 均 不 显著 。 


3.0 口 放置 目标 物 至 智能 体 
目 放 置 目标 物 至 石头 


决策 标准 (B) 


= 
© 


0.0 


角色 交换 结构 改变 角色 交换 结构 改变 


实验 三 a 实验 三 b 
存在 栅栏 的 情境 不 存在 栅栏 的 情境 
附 图 2 实验 三 a 和 实验 三 b 中 不 同 条 件 下 决策 标准 B (误差 线 代表 标准 误 ) 
3 被 试 内 设计 初步 结果 
关于 被 试 内 设计 ， 初 步 收集 了 10 名 被 试 。 结 果 发 现 ， 存 在 栅栏 时 ， 放 置 至 智能 体 的 激 
活 显著 强 于 放置 至 石头 (Wilcoxon W = 5.00, p = 0.020, Cohen’s d = 0.82); 而 不 存在 栅栏 时 ， 


激活 不 存在 显著 差异 (Wilcoxon W = 34.00, p = 0.557, Cohen’s dg= 0.24)， 且 当 智 能 体 A 将 苹果 
放置 至 智能 体 B 时 , 存在 栅栏 时 的 激活 存在 显著 强 于 不 存在 栅栏 时 激活 的 趋势 (Wilcoxon W= 


9.00, p = 0.064, Cohen’s d = 0.67)。 


